1
通用型 GPU 架構的演進轉變
AI032Lesson 12
00:00

NVIDIA GT200Fermi 架構 標誌著 第三代 GPU 計算。雖然先前的架構是以圖形為主的單元「改造」用於數學運算,但 Fermi 是從零開始專為 GPGPU(通用型 GPU) 應用而設計。

1. 從圖形優先到計算優先

與只注重紋理單元和僵化資料平行化的 GT200 不同,Fermi 引入了統一的記憶體請求路徑。此轉變啟用了 計算思維,讓開發者得以超越簡單的二維網格映射,邁向複雜的 C++ 算法。

GT200:圖形演進僅支援紋理單元無統一快取僅能手動管理共享記憶體Fermi:GPGPU 革命統一的 L2 快取含 L1 快取的串流多處理器(SM)IEEE 754-2008 双精準浮點運算(FP64)

2. 記憶體階層的躍進

Fermi 引入了真正的 L1/L2 快取階層 以及符合 IEEE 754-2008 浮點運算標準。這代表研究人員不再需要為每個字節手動管理「暫存記憶體」(共享記憶體),從而能支援不規則的資料結構,並提供適合科學工程應用的雙精準度準確性。

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>